Variables

j pour le pays d’origine et t pour le mois entre 2007-2019

Variable Y

Y_{j,t} = nombre d’arrivées touristiques (j,t)

Variables X

  • Taux de change $/€, t

  • Distance * prix de Brent, (j,t)

  • Indices des cours des actions , (j,t)

Variable binaire :

  • Europe, Asie, Amerique, Pacific / Pacific –> référence

  • 1er vol de French Bee en Mai 2018

  • Hub : France, USA, Japon et NZ

  • Mois –> Tendance et saison / Mois de janvier –> référence

  • Expedia, accord entre Tahiti Tourism et Expedia depuis Mai 2012

#importation donnees panel 
path_base <- "data_gravity.csv"
df <- read.csv(path_base,  sep=";", header = TRUE )
df$period <- as.yearmon(df$period,format="%m/%Y")

Graphique avec ggplot2

Régression MCO simple

#---modele MCO simple
fit_mco <- lm(log(nb_tourism+1)~ log(dist_oil)+log(price)+Tx_change+
                as.factor(mois)+ europe+asia+america+
                hub,data=df) 
summary(fit_mco)
## 
## Call:
## lm(formula = log(nb_tourism + 1) ~ log(dist_oil) + log(price) + 
##     Tx_change + as.factor(mois) + europe + asia + america + hub, 
##     data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.3849 -0.7076 -0.0506  0.7034  4.1343 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        3.821909   0.823585   4.641 3.58e-06 ***
## log(dist_oil)      0.148586   0.066023   2.251 0.024465 *  
## log(price)         0.199995   0.067169   2.977 0.002922 ** 
## Tx_change         -0.229469   0.146453  -1.567 0.117224    
## as.factor(mois)2  -0.004123   0.087526  -0.047 0.962428    
## as.factor(mois)3   0.044781   0.087646   0.511 0.609430    
## as.factor(mois)4   0.029811   0.087782   0.340 0.734169    
## as.factor(mois)5   0.032598   0.087874   0.371 0.710684    
## as.factor(mois)6   0.059903   0.087939   0.681 0.495785    
## as.factor(mois)7   0.322034   0.087864   3.665 0.000250 ***
## as.factor(mois)8   0.134308   0.087715   1.531 0.125797    
## as.factor(mois)9   0.229918   0.087785   2.619 0.008847 ** 
## as.factor(mois)10  0.314954   0.087882   3.584 0.000342 ***
## as.factor(mois)11  0.162616   0.087638   1.856 0.063587 .  
## as.factor(mois)12  0.137751   0.087585   1.573 0.115846    
## europe            -2.423336   0.097344 -24.895  < 2e-16 ***
## asia              -2.925646   0.091325 -32.036  < 2e-16 ***
## america           -1.375575   0.082726 -16.628  < 2e-16 ***
## hub                3.581755   0.059757  59.938  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.18 on 4349 degrees of freedom
## Multiple R-squared:  0.5536, Adjusted R-squared:  0.5517 
## F-statistic: 299.6 on 18 and 4349 DF,  p-value: < 2.2e-16
#Vérification des hypothèses statistiques 

#Si les résidus suivent une loi normal 
shapiro.test(resid(fit_mco)) #p-value < 5% on accepte la normalité des residus 
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(fit_mco)
## W = 0.99234, p-value = 1.39e-14
#test de RAMSEY --> RESET : consiste à vérifier si le modèle sélectionné est linéaire ou non
reset(fit_mco)
## 
##  RESET test
## 
## data:  fit_mco
## RESET = 9.4814, df1 = 2, df2 = 4347, p-value = 7.784e-05
#p_value 7.801e-05<0.05 le test de linearite est valide 

#verifier l'hypothèse d'homoscédacticité 
bptest(fit_mco) #pvalue<0.05
## 
##  studentized Breusch-Pagan test
## 
## data:  fit_mco
## BP = 498.16, df = 18, p-value < 2.2e-16
#Refus de l’hypothèse d’homoscédacticité des résidus au seuil de risque de 5%
#----

Régression modèle Gravité / Panel

#---- Modele de gravite ----
#Poisson pseudo maximum likelihood W/ fixed effects
#modele de gravite avec ppml avec regression sous forme log-log
fit <- ppml(
  dependent_variable = "lnb_tourism",
  distance = "dist_oil",
  additional_regressors = c("lprice","Tx_change","europe","asia",
                            "america","hub","french_bee","expedia",
                            "fev","mar","avr","mai","jui","juil",
                            "aou","sep","oct","nov","dec"),
  data = df
)
summary(fit)
## 
## Call:
## y_ppml ~ dist_log + lprice + Tx_change + europe + asia + america + 
##     hub + french_bee + expedia + fev + mar + avr + mai + jui + 
##     juil + aou + sep + oct + nov + dec
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -2.94718  -0.34652  -0.00908   0.33007   1.85648  
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.3384556  0.1882270   7.111 1.34e-12 ***
## dist_log     0.0289085  0.0148115   1.952 0.051031 .  
## lprice       0.0401641  0.0173177   2.319 0.020427 *  
## Tx_change   -0.0403766  0.0402402  -1.003 0.315728    
## europe      -0.4627869  0.0206298 -22.433  < 2e-16 ***
## asia        -0.5742328  0.0193732 -29.641  < 2e-16 ***
## america     -0.2633078  0.0166032 -15.859  < 2e-16 ***
## hub          0.6104078  0.0112029  54.487  < 2e-16 ***
## french_bee   0.0297984  0.0140130   2.126 0.033519 *  
## expedia     -0.0040554  0.0120557  -0.336 0.736592    
## fev         -0.0006656  0.0200444  -0.033 0.973511    
## mar          0.0099578  0.0200117   0.498 0.618791    
## avr          0.0068489  0.0200488   0.342 0.732661    
## mai          0.0053984  0.0201048   0.269 0.788317    
## jui          0.0113721  0.0200673   0.567 0.570949    
## juil         0.0654098  0.0198007   3.303 0.000963 ***
## aou          0.0268497  0.0199661   1.345 0.178770    
## sep          0.0467012  0.0198719   2.350 0.018812 *  
## oct          0.0656808  0.0198526   3.308 0.000946 ***
## nov          0.0347782  0.0198876   1.749 0.080406 .  
## dec          0.0295773  0.0199126   1.485 0.137522    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for quasipoisson family taken to be 0.3381264)
## 
##     Null deviance: 3007.6  on 4367  degrees of freedom
## Residual deviance: 1603.4  on 4347  degrees of freedom
## AIC: NA
## 
## Number of Fisher Scoring iterations: 4